home *** CD-ROM | disk | FTP | other *** search
/ Games of Daze / Infomagic - Games of Daze (Summer 1995) (Disc 1 of 2).iso / x2ftp / msdos / faq / audio.309 / text0000.txt < prev    next >
Encoding:
Text File  |  1994-08-05  |  48.9 KB  |  1,124 lines

  1. Archive-name: audio-fmts/part1
  2. Submitted-by: Guido van Rossum <guido@cwi.nl>
  3. Version: 3.09
  4. Last-modified: 1-Aug-1994
  5.  
  6. FAQ: Audio File Formats
  7. =======================
  8.  
  9. Table of contents
  10. -----------------
  11.  
  12. Introduction
  13. Device characteristics
  14. Popular sampling rates
  15. Compression schemes
  16. Current hardware
  17. File formats
  18. File conversions
  19. Playing audio files on UNIX
  20. Playing audio files on micros
  21. The Sound Site Newsletter
  22. Posting sounds
  23.  
  24. Appendices (in part 2):
  25.  
  26. FTP access for non-internet sites
  27. AIFF Format (Audio IFF)
  28. The NeXT/Sun audio file format
  29. IFF/8SVX Format
  30. Playing sound on a PC
  31. The EA-IFF-85 documentation
  32. US Federal Standard 1016 availability
  33. Creative Voice (VOC) file format
  34. RIFF WAVE (.WAV) file format
  35. U-LAW and A-LAW definitions
  36. AVR File Format
  37. The Amiga MOD Format
  38.  
  39.  
  40. Introduction
  41. ------------
  42.  
  43. This is version 3 of this FAQ, which I started in November 1991 under
  44. the name "The audio formats guide".  I bumped the major version number
  45. again at the occasion of the split in two parts: part one is the main
  46. text and part two consists of the collection of appendices.
  47.  
  48. I am posting this about once a fortnight, either unchanged (just to
  49. inform new readers), or updated (if I learn more or when new hardware
  50. or software becomes popular).  I post to alt.binaries.sounds.{misc,d}
  51. and to comp.dsp, for maximal coverage of people interested in audio,
  52. and to {news,comp}.answers, for easy reference.
  53.  
  54. The entire FAQ is also available by anonymous ftp from ftp.cwi.nl,
  55. directory pub/audio, files AudioFormats.{part1,part2}.
  56.  
  57. BTW: All FAQs, including this one, are available for anonymous ftp on
  58. the archive site rtfm.mit.edu in directory /pub/usenet/news.answers/.
  59. The name under which a FAQ is archived appears in the "Archive-Name:"
  60. line at the top of the article.  This FAQ is archived as
  61. audio-fmts/part[12].
  62.  
  63. A companion posting with subject "Changes to: ..." is occasionally
  64. posted listing the diffs between a new version and the last.  This is
  65. not reposted, and it is suppressed when the diffs are bigger than the
  66. new version.
  67.  
  68. Send updates, comments and questions to <guido@cwi.nl>.  I'd like to
  69. thank everyone who sent updates in the past.
  70.  
  71. --Guido van Rossum, CWI, Amsterdam <guido@cwi.nl>
  72.  
  73.  
  74. Device characteristics
  75. ----------------------
  76.  
  77. In this text, I will only use the term "sample" to refer to a single
  78. output value from an A/D converter, i.e., a small integer number
  79. (usually 8 or 16 bits).
  80.  
  81. Audio data is characterized by the following parameters, which
  82. correspond to settings of the A/D converter when the data was
  83. recorded.  Naturally, the same settings must be used to play the data.
  84.  
  85. - sampling rate (in samples per second), e.g. 8000 or 44100
  86.  
  87. - number of bits per sample, e.g. 8 or 16
  88.  
  89. - number of channels (1 for mono, 2 for stereo, etc.)
  90.  
  91. Approximate sampling rates are often quoted in Hz or kHz ([kilo-]
  92. Hertz), however, the politically correct term is samples per second
  93. (samples/sec).  Sampling rates are always measured per channel, so for
  94. stereo data recorded at 8000 samples/sec, there are actually 16000
  95. samples in a second.  I will sometimes write 8 k as a shorthand for
  96. 8000 samples/sec.
  97.  
  98. Multi-channel samples are generally interleaved on a frame-by-frame
  99. basis: if there are N channels, the data is a sequence of frames,
  100. where each frame contains N samples, one from each channel.  (Thus,
  101. the sampling rate is really the number of *frames* per second.)  For
  102. stereo, the left channel usually comes first.
  103.  
  104. The specification of the number of bits for U-LAW (pronounced mu-law
  105. -- the u really stands for the Greek letter mu) samples is somewhat
  106. problematic.  These samples are logarithmically encoded in 8 bits,
  107. like a tiny floating point number; however, their dynamic range is
  108. that of 12 bit linear data.  Source for converting to/from U-LAW
  109. (written by Jef Poskanzer) is distributed as part of the SOX package
  110. mentioned below; it can easily be ripped apart to serve in other
  111. applications.  The official definition is the CCITT standard G.711.
  112.  
  113. There exists another encoding similar to U-LAW, called A-LAW, which
  114. is used as a European telephony standard.  There is less support for
  115. it in UNIX workstations.
  116.  
  117. (See the Appendix for some formulae describing U-LAW and A-LAW.)
  118.  
  119.  
  120. Popular sampling rates
  121. ----------------------
  122.  
  123. Some sampling rates are more popular than others, for various reasons.
  124. Some recording hardware is restricted to (approximations of) some of
  125. these rates, some playback hardware has direct support for some.  The
  126. popularity of divisors of common rates can be explained by the
  127. simplicity of clock frequency dividing circuits :-).
  128.  
  129. Samples/sec     Description
  130.  
  131. 5500            One fourth of the Mac sampling rate (rarely seen).
  132.  
  133. 7333            One third of the Mac sampling rate (rarely seen).
  134.  
  135. 8000            Exactly 8000 samples/sec is a telephony standard that
  136.                 goes together with U-LAW (and also A-LAW) encoding.
  137.                 Some systems use an slightly different rate; in
  138.                 particular, the NeXT workstation uses 8012.8210513,
  139.                 apparently the rate used by Telco CODECs.
  140.  
  141. 11 k            Either 11025, a quarter of the CD sampling rate,
  142.                 or half the Mac sampling rate (perhaps the most
  143.                 popular rate on the Mac).
  144.  
  145. 16000           Used by, e.g. the G.722 compression standard.
  146.  
  147. 18.9 k          CD-ROM/XA standard.
  148.  
  149. 22 k            Either 22050, half the CD sampling rate, or the Mac
  150.                 rate; the latter is precisely 22254.545454545454 but
  151.                 usually misquoted as 22000.  (Historical note:
  152.                 22254.5454... was the horizontal scan rate of the
  153.                 original 128k Mac.)
  154.  
  155. 32000           Used in digital radio, NICAM (Nearly Instantaneous
  156.                 Compandable Audio Matrix [IBA/BREMA/BBC]) and other
  157.                 TV work, at least in the UK; also long play DAT and
  158.                 Japanese HDTV.
  159.  
  160. 37.8 k          CD-ROM/XA standard for higher quality.
  161.  
  162. 44056           This weird rate is used by professional audio
  163.                 equipment to fit an integral number of samples in a
  164.                 video frame.
  165.  
  166. 44100           The CD sampling rate.  (DAT players recording
  167.                 digitally from CD also use this rate.)
  168.  
  169. 48000           The DAT (Digital Audio Tape) sampling rate for
  170.                 domestic use.
  171.  
  172. Files samples on SoundBlaster hardware have sampling rates that are
  173. divisors of 1000000.
  174.  
  175. While professinal musicians disagree, most people don't have a problem
  176. if recorded sound is played at a slightly different rate, say, 1-2%.
  177. On the other hand, if recorded data is being fed into a playback
  178. device in real time (say, over a network), even the smallest
  179. difference in sampling rate can frustrate the buffering scheme used...
  180.  
  181. There may be an emerging tendency to standardize on only a few
  182. sampling rates and encoding styles, even if the file formats may
  183. differ.  The suggested rates and styles are:
  184.  
  185.     rate (samp/sec) style mono/stereo
  186.  
  187.     8000 8-bit U-LAW mono
  188.     22050 8-bit linear unsigned mono and stereo
  189.     44100 16-bit linear signed mono and stereo
  190.  
  191.  
  192. Compression schemes
  193. -------------------
  194.  
  195. Strange though it seems, audio data is remarkably hard to compress
  196. effectively.  For 8-bit data, a Huffman encoding of the deltas between
  197. successive samples is relatively successful.  For 16-bit data,
  198. companies like Sony and Philips have spent millions to develop
  199. proprietary schemes.  Information about PASC (Philips' scheme) can be
  200. found in Advanced Digital Audio by Ken C. Pohlmann.
  201.  
  202. Public standards for voice compression are slowly gaining popularity,
  203. e.g. CCITT G.721 (ADPCM at 32 kbits/sec) and G.723 (ADPCM at 24 and 40
  204. kbits/sec).  (ADPCM == Adaptive Delta Pulse Code Modulation.)  Sun
  205. Microsoft has placed the source code of a portable implementation of
  206. these algorithms (as well as G.711, which defines A-LAW and U-LAW) in
  207. the public domain (needless to say, their proprietary implementation
  208. distributed in binary form with Solaris is better :-).  One place to
  209. ftp this source code from is ftp.cwi.nl:/pub/audio/ccitt-adpcm.tar.Z.
  210. Source for another 32 kbits/sec ADPCM implementation, assumed to be
  211. compatible with Intel's DVI audio format, can be ftp'ed from
  212. ftp.cwi.nl:/pub/audio/adpcm.shar.  (** NOTE: if you are using v1.0,
  213. you should get v1.1, released 17-Dec-1992, which fixes a serious bug
  214. -- the quality of v1.1 is claimed to be better than U-LAW **)
  215.  
  216. GSM 06.10 is a speech encoding in use in Europe that compresses 160
  217. 13-bit samples into 260 bits (or 33 bytes), i.e. 1650 bytes/sec (at
  218. 8000 samples/sec).  A free implementation can be ftp'ed from
  219. tub.cs.tu-berlin.de, file /pub/tubmik/gsm-1.0.tar.Z.
  220.  
  221. There are also two US federal standards, 1016 (Code excited linear
  222. prediction (CELP), 4800 bits/s) and 1015 (LPC-10E, 2400 bits/s).  See
  223. also the appendix for 1016.
  224.  
  225. Tony Robinson <ajr@eng.cam.ac.uk> has written a good FAST loss-less
  226. compression for lots of different audio formats (particularly good for
  227. WAV and MOD files).  The software is available by anonymous ftp from
  228. svr-ftp.eng.cam.ac.uk, directory misc, file shorten-1.08.tar.Z.
  229.  
  230. (Note that U-LAW and silence detection can also be considered
  231. compression schemes.)
  232.  
  233. Here's a note about audio codings by Van Jacobson <van@ee.lbl.gov>:
  234. Several people used the words "LPC" and "CELP" interchangably.  They
  235. are very different.  An LPC (Linear Predictive Coding) coder fits
  236. speech to a simple, analytic model of the vocal tract, then throws
  237. away the speech & ships the parameters of the best-fit model.  An LPC
  238. decoder uses those parameters to generate synthetic speech that is
  239. usually more-or-less similar to the original.  The result is
  240. intelligible but sounds like a machine is talking.  A CELP (Code
  241. Excited Linear Predictor) coder does the same LPC modeling but then
  242. computes the errors between the original speech & the synthetic model
  243. and transmits both model parameters and a very compressed
  244. representation of the errors (the compressed representation is an
  245. index into a 'code book' shared between coders & decoders -- this is
  246. why it's called "Code Excited").  A CELP coder does much more work
  247. than an LPC coder (usually about an order of magnitude more) but the
  248. result is much higher quality speech: The FIPS-1016 CELP we're working
  249. on is essentially the same quality as the 32Kb/s ADPCM coder but uses
  250. only 4.8Kb/s (the same as the LPC coder).
  251.  
  252. The comp.compression FAQ has some text on the 6:1 audio compression
  253. scheme used by MPEG (a video compression standard-to-be).  It's
  254. interesting to note that video compression reaches much higher ratios
  255. (like 26:1).  This FAQ is ftp'able from rtfm.mit.edu in directory
  256. /pub/usenet/news.answers/compression-faq, files part1 and part2.
  257.  
  258. Comp.compression also carries a regular posting "How to uncompress
  259. anything" by David Lemson <lemson@uiuc.edu>, which (tersely) hints on
  260. which program you need to uncompress a file whose name ends in .<foo>
  261. for almost any conceivable <foo>.  Ftp'able from ftp.cso.uiuc.edu
  262. in the directory /doc/pcnet as the file compression.
  263.  
  264. Documentation on a digital cellular telephone system by Qualcomm Inc.
  265. can be ftp'ed from ftp.qualcomm.com:/pub/cdma; the vocoder is in
  266. appendix A.
  267.  
  268. Apple has an Audio Compression/Expansion scheme called ACE (on the GS)
  269. / MACE (on the Macintosh).  It's a lossy scheme that attempts to
  270. predict where the wave will go on the next sample. There's very little
  271. quality change on 8:4 compression, somewhat more for 8:3.  It does
  272. guarantee exactly 50% or 62.5% compression, though.  I believe MACE
  273. uses larger ratios/more loss, but I'm unsure of the specific numbers.
  274. (Marc Sira)
  275.  
  276.  
  277. Current hardware
  278. ----------------
  279.  
  280. I am aware of the following computer systems that can play back and
  281. (sometimes) record audio data, with their characteristics.  Note that
  282. for most systems you can also buy "professional" sampling hardware,
  283. which supports much better quality, e.g. >= 44.1 k 16 bits stereo.
  284. The characteristics listed here are a rough estimate of the
  285. capabilities of the basic hardware only (and even here I am on thin
  286. ice, with systems becoming ever more powerful).
  287.  
  288. machine             bits            max sampling rate    #output channels
  289.  
  290. Mac (all types)     8               22k                  1
  291. Mac (newer ones)    16              64k                  4(128)
  292. Apple IIgs          8               32k / >70k           16(st)
  293. PC/soundblaster pro 8               ?/(22k st, 44.1k mo) 1(st)
  294. PC/soundblaster 16  16              44.1k                1(st)
  295. PC/pas              8               44.1k st, 88.2k mo   1(st)
  296. PC/pas-16           16              44.1k st, 88.2k mo   1(st)
  297. PC/turtle beach multisound 16       44.1k                1(st)
  298. PC/cards with aria chipset 16       44.1k                1(st)
  299. PC/roland rap-10    16              44.1k                1(st)
  300. PC/gravis ultrasound 8/16           44.1k                14-32(st)
  301. Atari ST            8               22k                  1
  302. Atari STE,TT        8               50k                  2
  303. Atari Falcon 030    16              50k                  8(st)
  304. Amiga               8               varies above 29k     4(st)
  305. Sun Sparc           U-LAW           8k                   1
  306. Sun Sparcst. 10     U-LAW,8,16      48k                  1(st)
  307. NeXT                U-LAW,8,16      44.1k                1(st)
  308. SGI Indigo          8,16            48k                  4(st)
  309. SGI Indigo2,Indy    8,16            48k                  16(st,4-channel)
  310. Acorn Archimedes    ~U-LAW          ~180k                8(st)
  311. Sony NWS-3xxx       U,A,8,16        8-37.8k              1(st)
  312. Sony NWS-5xxx       U,A,8,16        8-48k                1(st)
  313. VAXstation 4000     U-LAW           8k                   1
  314. DEC 3000            U-LAW           8k                   1
  315. DEC 5000/20-25      U-LAW           8k                   1
  316. Tandy 1000/*L*      8               >=44k                1
  317. Tandy 2500          8               >=44k                1
  318. HP9000/705,710,425e U,A-LAW,16      8k                   1
  319. HP9000/715,725,735  U,A-LAW,16      48k                  1(st)
  320. HP9000/755 option:  U,A-LAW,16      48k                  1(st)
  321. NCD MCX terminal    U,A,8,16        52k                  1(st)
  322.  
  323. 4(st) means "four voices, stereo"; sampling rates xx/yy are
  324. different recording/playback rates; *L* is any type with 'L' in it.
  325.  
  326. All these machines can play back sound without additional hardware,
  327. although the needed software is not always standard; also, some
  328. machines need external hardware to record sound (or to record at
  329. higher quality, like the NeXT, whose built-in sampling hardware only
  330. does 8000 samples/sec in U-LAW).  Please don't send me details on
  331. optional or 3rd party hardware, there is too much and it is really
  332. beyond the scope of this FAQ.  In particular, there is a separate
  333. newsgroup devoted to PC sound cards: comp.sys.ibm.pc.soundcard, which
  334. includes FAQ of its own (also posted to comp.answers and news.answers).
  335.  
  336. The new VAXstation 4000 (VLC and model 60) series lets you PLAY audio
  337. (.au) files, and the package DECsound will let you do the recording.
  338. In fact, DECsound is given away free with Motif 1.1 and supports the
  339. VAXstation, Sun SPARCstation, DECvoice, and DECaudio devices.  Sun
  340. sound files work without change.  The Alpha systems also have DECsound
  341. bundled with Motif.  Also, the DEC2000/300 (aka DECpc AXP 150) can use
  342. a Microsoft Sound Card, with AudioFile (see below) for sound.
  343.  
  344. Notes for the DECstation 5000/20-25: You need either XMedia tools from
  345. DEC ($$$$), or the AudioFile package (which works nicely) from
  346. crl.dec.com (see below). The audio device is "/dev/bba", you cannot
  347. send ".au" files directly to the device, the Xmedia/AF software
  348. provide an "audioserver" which must be run to play/record sounds.
  349.  
  350. The SGI Personal IRIS 4D/30 and 4D/35 have the same capabilities as
  351. the Indigo. The audio board was optional on the 4D/30.
  352. The Indigo2 and Indy features are a superset of the Indigo features.
  353.  
  354. The new Apple Macs have more powerful audio hardware; the latest
  355. models have built-in microphones.
  356.  
  357. Software exists for the PC that can play sound on its 1-bit speaker
  358. using pulse width modulation (see appendix); the Soundblaster board
  359. records at rates up to 13 k and plays back up to 22 k (weird
  360. combination, but that's the way it is).
  361.  
  362. Here's some info about the newest Atari machine, the Falcon030.  This
  363. machine has stereo 16 bit CODECs and a 32 MHz Motorola 56001 that can
  364. handle 8 channels of 16 bit audio, up to 50 khz/channel with
  365. simultaneous playback and record.  The Falcon DMA sound engine is also
  366. compatible with the 8 bit stereo DMA used on the STe and TT. All of
  367. these systems use signed data.
  368.  
  369. On the NeXT, the Motorola 56001 DSP chip is programmable and you can
  370. (in principle) do what you want.  The SGI Indigo uses the same DSP chip but
  371. it can't be programmed by users -- SGI prefers to offer it as a shared
  372. system resource to multiple applications, thus enabling developers to
  373. program audio with their Audio Library and avoid code modifications
  374. for execution on future machines with different audio hardware, i.e. a
  375. different DSP. For example, the Indigo2 and Indy do not have a DSP chip.
  376.  
  377. The Amiga also has a 6-bit volume, which can be used to produce
  378. something like a 14-bit output for each voice.  The hardware can also
  379. use one of each voice-pair to modulate the other in FM (period) or AM
  380. (volume, 6-bits).
  381.  
  382. The Acorn Archimedes uses a variation on U-LAW with the bit order
  383. reversed and the sign bit in bit 0.  Being a 'minority' architecture,
  384. Arc owners are quite adept at converting sound/image formats from
  385. other machines, and it is unlikely that you'll ever encounter sound in
  386. one of the Arc's own formats (there are several).
  387.  
  388. Tandy notes (Jeffrey L. Hayes <tvdog@delphi.com>): The maximum
  389. sampling rate for output is at least 44k.  (I don't know the maximum
  390. rates; I have recorded at 22k and played at 44k.  Higher rates are
  391. probably possible.)  There is one output channel, not three.  The
  392. belief that there are 3 channels probably stems from the fact that
  393. Music.pdm, bundled with these machines, can create 3- channel music
  394. modules (analogous to Amiga .mod's).  Music.pdm probably does that
  395. because it is designed to work with the Tandy's 3-voice tone generator
  396. circuitry (compatible with the Texas Instruments SN76496 in the IBM
  397. PC-Jr) if there is insufficient RAM to load sound samples.  The Tandy
  398. chip is able to record at lower rates than it is able to play back, as
  399. is the Soundblaster (i.e., the divider used to program the chip to
  400. record is lower than that used to program the chip to play back).  The
  401. Tandy DAC can go faster than the original Soundblaster, however.
  402.  
  403. The NCD MCX terminal has audio integrated with its X server.  The
  404. NCDAudio server is an extension of the X server, working together with
  405. it, with stress on the networking capability of sound transmission.
  406. The NCDAudio API provides format handling (ULAW8, Linear Unsig 8,
  407. Linear Sig 8, Linear Sig 16 MSB, Linear Unsig 16 MSB), flowing (to the
  408. server, from the server, to the i/o, from the i/o), wave form
  409. generators (Square, Sine, Saw, Constant) and the capability of area
  410. broadcast using UDP.  Provision for manipulating data files
  411. (SND, WAV, VOC & AU) is also provided.
  412.  
  413. CD-I machines form a special category.  The following formats are used:
  414.  
  415.      - PCM 44.1 kHz standard CD format
  416.      - ADPCM - Addaptive Delta PCM
  417.        - Level A 37.8 kHz 8-bit
  418.        - Level B 37.8 kHz 4-bit
  419.        - Level C 18.9 kHz 4-bit
  420.  
  421.  
  422. File formats
  423. ------------
  424.  
  425. Historically, almost every type of machine used its own file format
  426. for audio data, but some file formats are more generally applicable,
  427. and in general it is possible to define conversions between almost any
  428. pair of file formats -- sometimes losing information, however.
  429.  
  430. File formats are a separate issue from device characteristics.  There
  431. are two types of file formats: self-describing formats, where the
  432. device parameters and encoding are made explicit in some form of
  433. header, and "raw" formats, where the device parameters and encoding
  434. are fixed.
  435.  
  436. Self-describing file formats generally define a family of data
  437. encodings, where a header fields indicates the particular encoding
  438. variant used.  Headerless formats define a single encoding and usually
  439. allows no variation in device parameters (except sometimes sampling
  440. rate, which can be a pain to figure out other than by listening to the
  441. sample).
  442.  
  443. The header of self-describing formats contains the parameters of the
  444. sampling device and sometimes other information (e.g. a
  445. human-readable description of the sound, or a copyright notice).  Most
  446. headers begin with a simple "magic word".  (Some formats do not simply
  447. define a header format, but may contain chunks of data intermingled
  448. with chunks of encoding info.)  The data encoding defines how the
  449. actual samples are stored in the file, e.g. signed or unsigned, as
  450. bytes or short integers, in little-endian or big-endian byte order,
  451. etc.  Strictly spoken, channel interleaving is also part of the
  452. encoding, although so far I have seen little variation in this area.
  453.  
  454. Some file formats apply some kind of compression to the data, e.g.
  455. Huffman encoding, or simple silence deletion.
  456.  
  457. Here's an overview of popular file formats.
  458.  
  459.         Self-describing file formats
  460.         ----------------------------
  461.  
  462. extension, name   origin          variable parameters (fixed; comments)
  463.  
  464. .au or .snd       NeXT, Sun       rate, #channels, encoding, info string
  465. .aif(f), AIFF     Apple, SGI      rate, #channels, sample width, lots of info
  466. .aif(f), AIFC     Apple, SGI      same (extension of AIFF with compression)
  467. .iff, IFF/8SVX    Amiga           rate, #channels, instrument info (8 bits)
  468. .voc              Soundblaster    rate (8 bits/1 ch; can use silence deletion)
  469. .wav, WAVE        Microsoft       rate, #channels, sample width, lots of info
  470. .sf               IRCAM           rate, #channels, encoding, info
  471. none, HCOM        Mac             rate (8 bits/1 ch; uses Huffman compression)
  472. none, MIME        Internet        (see below)
  473. none, NIST SPHERE DARPA speech community (see below)
  474. .mod or .nst      Amiga           (see below)
  475.  
  476. Note that the filename extension ".snd" is ambiguous: it can be either
  477. the self-describing NeXT format or the headerless Mac/PC format, or
  478. even a headerless Amiga format.
  479.  
  480. I know nothing for sure about the origin of HCOM files, only that
  481. there are a lot of them floating around on our system and probably at
  482. FTP sites over the world.  The filenames usually don't have a ".hcom"
  483. extension, but this is what SOX (see below) uses.  The file format
  484. recognized by SOX includes a MacBinary header, where the file
  485. type field is "FSSD".  The data fork begins with the magic word "HCOM"
  486. and contains Huffman compressed data; after decompression it it is 8
  487. bits unsigned data.
  488.  
  489. IFF/8SVX allows for amplitude contours for sounds (attack/decay/etc).
  490. Compression is optional (and extensible); volume is variable; author,
  491. notes and copyright properties; etc.
  492.  
  493. AIFF, AIFC and WAVE are similar in spirit but allow more freedom in
  494. encoding style (other than 8 bit/sample), amongst others.
  495.  
  496. There are other sound formats in use on Amiga by digitizers and music
  497. programs, such as IFF/SMUS.
  498.  
  499. Appendices describes the NeXT and VOC formats; pointers to more info
  500. about AIFF, AIFC, 8SVX and WAVE (which are too complex to describe
  501. here) are also in appendices.
  502.  
  503. DEC systems (e.g. DECstation 5000) use a variant of the NeXT format
  504. that uses little-endian encoding and has a different magic number
  505. (0x0064732E in little-endian encoding).
  506.  
  507. Standard file formats used in the CD-I world are IFF but on the disc
  508. they're in realtime files.
  509.  
  510. An interesting "interchange format" for audio data is described in the
  511. proposed Internet Standard "MIME", which describes a family of
  512. transport encodings and structuring devices for electronic mail.  This
  513. is an extensible format, and initially standardizes a type of audio
  514. data dubbed "audio/basic", which is 8-bit U-LAW data sampled at 8000
  515. samples/sec.
  516.  
  517. The "IRCAM" sound file system has now been superseded by the so-called
  518. "BICSF" (for Berkeley/IRCAM/CARL Sound File system) software release.
  519. More recently, there has been an effort at Princeton (Prof. Paul
  520. Lansky) and Stanford (Stephen Travis Pope) to standardize several
  521. extensions to BICSF.  A description of BICSF and the
  522. Princeton/Stanford extensions is available by anonymous ftp from
  523. ftp.cwi.nl, in directory /pub/audio/BICSF-info.  This file contains
  524. further ftp pointers to software.
  525.  
  526. A sound file format popular in the DARPA speech community is the NIST
  527. SPHERE standard.  The most recent version of the SPHERE package is
  528. available via anonymous ftp from jaguar.ncsl.nist.gov in compressed
  529. tar form as "sphere-v.tar.Z" (where "v" is the version code).  The
  530. NIST SPHERE header is an object-oriented, 1024-byte blocked, ASCII
  531. structure which is prepended to the waveform data.  The header is
  532. composed of a fixed-format portion followed by an object-oriented
  533. variable portion.  I have placed a short description of NIST SPHERE on
  534. ftp.cwi.nl:/pub/audio/NIST-SPHERE.
  535.  
  536. Finally, a somewhat different but popular format are "MOD" files,
  537. usually with extension ".mod" or ".nst" (they can also have a prefix
  538. of "mod.").  This originated at the Amiga but players now exist for
  539. many platforms.  MOD files are music files containing 2 parts: (1) a
  540. bank of digitized samples; (2) sequencing information describing how
  541. and when to play the samples.  See the appendix "The Amiga MOD Format"
  542. for a description of this file format (and pointers to ftp'able
  543. players and example MOD files).
  544.  
  545.         Headerless file formats
  546.         -----------------------
  547.  
  548. extension       origin          parameters
  549. or name
  550.  
  551. .snd, .fssd     Mac, PC         variable rate, 1 channel, 8 bits unsigned
  552. .ul             US telephony    8 k, 1 channel, 8 bit "U-LAW" encoding
  553. .snd?           Amiga           variable rate, 1 channel, 8 bits signed
  554.  
  555. It is usually easy to distinguish 8-bit signed formats from unsigned
  556. by looking at the beginning of the data with 'od -b <file | head';
  557. since most sounds start with a little bit of silence containing small
  558. amounts of background noise, the signed formats will have an abundance
  559. of bytes with values 0376, 0377, 0, 1, 2, while the unsigned formats
  560. will have 0176, 0177, 0200, 0201, 0202 instead.  (Using "od -c" will
  561. also show any headers that are tacked in front of the file.)
  562.  
  563. The Apple IIgs records raw data in the same format as the Mac, but
  564. uses a 0 byte as a terminator; samples with value 0 are replaced by 1.
  565.  
  566.         Sound formats and the Apple Macintosh
  567.         -------------------------------------
  568.  
  569. (Thanks to Bill Houle, <Bill.Houle@SanDiegoCA.NCR.COM>)
  570.  
  571.                              SOX/DOS   MAC
  572. Sound Format           file ext  type  Mac program to convert to 'snd'
  573. ---------------------- --------  ----  -------------------------------
  574. Mac snd                .snd      sfil  [n/a]
  575. Amiga IFF/8SVX         .iff            AmigaSndConverter, BST
  576. Amiga SoundTracker     .mod      STrk  ModVoicer
  577. Audio IFF              .aiff     AIFF  SoundExtractor, Sample Editor,
  578.                                        UUTool, BST, M5Mac
  579. DSP Designer                     DSPs  SoundHack
  580. IRCAM                  .sf       IRCM  SoundHack
  581. MacMix                           MSND  SoundHack
  582. RIFF WAVE              .wav            SoundExtractor, BST, Balthazar
  583. SoundBlaster           .voc            SoundExtractor, BST
  584. SoundDesigner/AudioMedia         Sd2f  SoundHack
  585. Sound[Edit|Cap|Wave]   .hcom     FSSD  SoundExtractor, SoundEdit,
  586.                                        Wavicle, BST
  587. Sun uLaw/Next .snd     .au/.snd  NxTS  SoundExtractor, SoundHack,
  588.                                        au<->snd, UUTool, BST
  589.  
  590.  
  591. File conversions
  592. ----------------
  593.  
  594.         SOX (UNIX, PC, Amiga)
  595.         ---------------------
  596.  
  597. The most versatile tool for converting between various audio formats
  598. is SOX ("Sound Exchange").  It can read and write various types of
  599. audio files, and optionally applies some special effects (e.g. echo,
  600. channel averaging, or rate conversion).
  601.  
  602. SOX recognizes all filename extensions listed above except ".snd",
  603. which would be ambiguous anyway, and ".wav" (but there's a patch, see
  604. below).  Use type ".au" for NeXT ".snd" files.  Mac and PC ".snd"
  605. files are completely described by these parameters:
  606.  
  607.         -t raw -b -u -r 11000
  608.  
  609. (or -r 22000 or -r 7333 or -r 5500; 11000 seems to be the most common
  610. rate).
  611.  
  612. The source for SOX, version 6, platchlevel 8, was posted to
  613. alt.sources, and should be widely archived.  (Patch 9 was posted later
  614. and incporporates some important .wav fixes.)  To save you the trouble
  615. of hunting it down, it can be gotten by anonymous ftp from
  616. wuarchive.wustl.edu, in the directory usenet/alt.sources/articles,
  617. files 7288.Z through 7295.Z.  (These files are compressed news
  618. articles containing shar files, if you hadn't guessed.)  I am sure
  619. many sites have similar archives, I'm just listing one that I know of
  620. and which carries a lot of this kind of stuff.  (Also see the appendix
  621. if you don't have Internet access.)
  622.  
  623. A compressed tar file containing the same version of SOX is available
  624. by anonymous ftp from ftp.cwi.nl, in directory
  625. /pub/audio/sox<version>.tar.Z.  You may be able to locate a nearer
  626. version using archie!
  627.  
  628. Ports of SOX:
  629.  
  630. - The source as posted should compile on any UNIX and PC system.
  631.  
  632. - A PC version is available by ftp from ftp.cwi.nl (see above) as
  633.   pub/audio/sox5dos.zip; also available from the garbo mail server.
  634.  
  635. - The latest Amiga SOX is available via anonymous ftp to
  636.   wuarchive.wustl.edu, files systems/amiga/audio/utils/amisox*.  (See
  637.   below for a non-SOX solution.)
  638.   The final release of r6 will compile as distributed on the Amiga with
  639.   SAS/C version 6.  Binaries (since many Amiga users do not own
  640.   compilers) will continue to be available for FTP.
  641.  
  642. SOX usage hints:
  643.  
  644. - Often, the filename extension of sound files posted on the net is
  645.   wrong.  Don't give up, try a few other possibilities using the
  646.   "-t <type>" option.  Remember that the most common file type is
  647.   unsigned bytes, which can be indicated with "-t ub".  You'll have to
  648.   guess the proper sampling rate, but often it's 11k or 22k.
  649.  
  650. - In particular, with SOX version 4 (or earlier), you have to
  651.   specify "-t 8svx" for files with an .iff extension.
  652.  
  653. - When converting linear samples to U-LAW using the .au type for the
  654.   output file, you must specify "-U" for the output file, otherwise
  655.   you will end up with a file containing a NeXT/Sun header but linear
  656.   samples -- only the NeXT will play such files correctly.  Also, you
  657.   must explicitly specify an output sampling rate with "-r 8000".
  658.   (This may seem fixed for most cases in version 5, but it is still
  659.   occasionally necessary, so I'm keeping this warning in.)
  660.  
  661.         Sun Sparc
  662.         ---------
  663.  
  664. On Sun Sparcs, starting at SunOS 4.1, a program "raw2audio" is
  665. provided by Sun (in /usr/demo/SOUND -- see below) which takes a raw
  666. U-LAW file and turns it into a ".au" file by prefixing it with an
  667. appropriate header.
  668.  
  669.         NeXT
  670.         ----
  671.  
  672. On NeXTs, you can usually rename .au files to .snd and it'll work like
  673. a charm, but some .au files lack header info that the NeXT needs.
  674. This can be fixed by using sndconvert:
  675.  
  676.         sndconvert -c 1 -f 1 -s 8012.8210513 -o nextfile.snd sunfile.au
  677.  
  678.         SGI Indigo, Indigo2, Indy and Personal IRIS
  679.         -------------------------------------------
  680.  
  681. SGI supports "soundfiler" (in /usr/sbin), a program similar in
  682. spirit to SOX but with a GUI.  Soundfiler plays aiff, aifc, NeXT/Sun
  683. and .wav formats.  It can do conversions between any of these formats
  684. and to and from raw formats including mulaw.  It also does sample rate
  685. conversions.
  686.  
  687. Three shell commands are also provided that give the same functionality:
  688. "sfplay", "sfconvert", and "aifcresample" (all in /usr/sbin).
  689.  
  690.         Amiga
  691.         -----
  692.  
  693. Mike Cramer's SoundZAP can do no effects except rate change and it
  694. only does conversions to IFF, but it is generally much faster than
  695. SOX.  (Ftp'able from the same directory as amisox above.)
  696.  
  697. Newer versions of OmniPlay (see below) will also convert to IFF.
  698.  
  699.         Tandy
  700.         -----
  701.  
  702. The Tandy uses a proprietary format, which can use compression
  703. (see appendix).  Jeffrey L. Hayes <tvdog@delphi.com> writes:
  704.  
  705. There is in fact a Windows 3.1 sound driver for the Tandy 2500-series 
  706. available from Radio Shack.  My informant says:  "Say that you have a 
  707. 2500SX/33 and you lost your Windows Utilities/Drivers disk.  The cost is 
  708. $5.00."  (The driver will work on any 2500.)
  709.  
  710. Version 2.00 of Conv2snd by Kenneth Udut by Kenneth Udut is now on
  711. Simtel.  It converts any 8-bit mono unsigned PCM file to Tandy
  712. DeskMate .snd format.  The new version recognizes RIFF WAVE headers
  713. and comes with a utility to convert .snd to .wav, Snd2wav.
  714.  
  715. In addition to the .snd format used by Sound.pdm, Tandy used an .sng format 
  716. with Music.pdm for song files.  .sng files are analogous to Amiga .mod 
  717. files, but they contain only the sequencing information.  The samples are 
  718. expected to be in .snd files in the current directory for Music.pdm.  It 
  719. should be possible to convert .sng to .mod - when I get around to it!
  720.  
  721. I am collecting information and programs for the Tandy DAC chip.  I have 
  722. written a DOS .wav player for the Tandy DAC, as well as a program to make 
  723. the Tandy DAC emulate a Covox DAC for use with programs that support the 
  724. Covox or a DAC on a parallel port.  Those interested may write to me and 
  725. ask for the "Tandy DAC package" - help is needed!  The package includes 
  726. source code and programming information on the Tandy chip.  A DOS .wav 
  727. recorder and an Amiga .mod player for the Tandy DAC are in progress.  There 
  728. are two other programs (to my knowledge) to record and play back sounds on 
  729. a Tandy - Sampler and Tndsnd.  These programs are on Delphi but not on the 
  730. Internet as far as I know; users not on Delphi can write to me and ask for 
  731. them.  Those wishing to make a public announcement regarding the Tandy DAC 
  732. should post to comp.sys.tandy.
  733.  
  734. Tandy now includes Soundblaster support in its machines.  New Tandy's do 
  735. not have the proprietary Tandy DAC.
  736.  
  737.  
  738.         Apple Macintosh
  739.         ---------------
  740.  
  741. Bill Houle sent the following list:
  742.  
  743. Popular commercial apps are indicated with a [*].  All other programs
  744. mentioned are shareware/freeware available from SUMEX and the various
  745. mirror sites, or check archie for the nearest FTP location.
  746.  
  747. MAC SOUND CONVERSION PROGRAMS
  748.  
  749. SoundHack [Tom Erbe, tom@mills.edu]
  750.   Can read/write Sound Designer II, Audio IFF, IRCAM, DSP Designer and NeXT 
  751.   .snd (or Sun .au); 8-bit uLaw, 8-bit linear, 32-bit floating point and 16-bit
  752.   linear data encoding.  Can read (but not write) raw data files.  Implements
  753.   soundfile convolution, a phase vocoder, a binaural filter and an amplitude 
  754.   analysis & gain change module.
  755.  
  756. SoundExtractor [Alberto Ricci, FRicci@polito.it]
  757.   Extracts 'snd' resources, AIFF, SoundEdit, VOC, and WAV data from
  758.   practically anything, converting to 'snd' files.
  759.  
  760. Balthazar [Craig Marciniak, AOL:TemplarDev]
  761.   Converts WAV files to 'snd'.
  762.   
  763. Brian's Sound Tool [Brian Scott, bscott@ironbark.ucnv.edu.au]
  764.   Converts 'snd' or SoundEdit to WAV.  Can also convert WAV, VOC, AIFF, Amiga
  765.   8SVX and uLaw to 'snd'.
  766.  
  767. AmigaSndConverter [Povl H. Pederson, eco861771@ecostat.aau.dk]
  768.   Converts Amiga IFF/8SVX to Mac 'snd'.
  769.  
  770. au<->Mac [Victor J. Heinz, vic:wbst128@xerox.com]
  771.   Converts Sun uLaw to Mac 'snd'.
  772.   
  773. ULAW [Rod Kennedy, rod@faceng.anu.edu.au]
  774.   Converts 'snd' to Sun uLaw.
  775.  
  776. UUTool [Bernie Wieser, wieser@acs.ucalgary.ca]
  777.   Primarily a uuencode/decode program, but in true Swiss Army Knife
  778.   fashion can also read/write Sun uLaw, AIFF, and 'snd' files.
  779.  
  780. ModVoicer [Kip Walker, Kip_Walker@mcimail.com]
  781.   Converts Amiga MOD voices into SoundEdit files or 'snd' resources.
  782.  
  783. Music 5 Mac [Simone Bettini, space@maya.dei.unipd.it]
  784.   Primarily a Music Synthesis system, but can also convert between 'snd', AIFF,
  785.   and IBM .DAT(?).
  786.  
  787. See also the section on players -- some players also do conversions.
  788.  
  789.  
  790. Playing audio files on UNIX
  791. ---------------------------
  792.  
  793. The commands needed to play an audio file depend on the file format
  794. and the available hardware and software.  Most systems can only
  795. directly play sound in their native format; use a conversion program
  796. (see above) to play other formats.
  797.  
  798.         Sun Sparcstation running SunOS 4.x
  799.         ----------------------------------
  800.  
  801. Raw U-LAW files can be played using "cat file >/dev/audio".
  802.  
  803. A whole package for dealing with ".au" files is provided by Sun on an
  804. experimental basis, in /usr/demo/SOUND.  You may have to compile the
  805. programs first.  (If you can't find this directory, either you are not
  806. running SunOS 4.1 yet, or your system administrator hasn't installed
  807. it -- go ask him for it, not me!)  The program "play" in this
  808. directory recognizes all files in Sun/NeXT format, but a SS 1 or 2 can
  809. play only those using U-LAW encoding at 8 k -- the SS 10 hardware
  810. plays other encodings, too.
  811.  
  812. If you ca't find "play", you can also cat a ".au" file to /dev/audio,
  813. if it uses U-LAW; the header will sound like a short burst of noise
  814. but the rest of the data will sound OK (really, the only difference in
  815. this case between raw U-LAW and ".au" files is the header; the U-LAW
  816. data is exactly the same).
  817.  
  818. Finally, OpenWindows 3.0 has a full-fledged audio tool.  You can drop
  819. audio file icons into it, edit them, etc.
  820.  
  821.         Sun Sparcstation running Solaris 2.0
  822.         ------------------------------------
  823.  
  824. Under SVR4 (and hence Solaris 2.0), writing to /dev/audio from the
  825. shell is a bad idea, because the device driver will flush its queue as
  826. soon as the file is closed.  Use "audioplay" instead.  The supported
  827. formats and sampling rates are the same as above.
  828.  
  829.         NeXT
  830.         ----
  831.  
  832. On NeXT machines, the standard "sndplay" program can play all NeXT
  833. format files (this include Sun ".au" files).  It supports at least
  834. U-LAW at 8 k and 16 bits samples at 22 or 44.1 k.  It attempts
  835. on-the-fly conversions for other formats.
  836.  
  837. Sound files are also played if you double-click on them in the file
  838. browser.
  839.  
  840.         SGI Indigo, Indigo2, Indy and Personal IRIS
  841.         -------------------------------------------
  842.  
  843. On SGI Indigo, Indigo2, Indy and the 4D/30 and /35 Personal IRIS workstations,
  844. "WorkSpace" plays audio files in .aiff, .aifc, .au, and .wav formats if
  845. you double click them and the sampling rate is one of 8000, 11025,
  846. 16000, 22050, 32000, 44100, or 48000.  On the Personal IRIS, you need
  847. to have the audio board installed (check the output from hinv) and you
  848. must run IRIX 3.3.2 or 4.0 or higher.  These files can also be played
  849. with "soundfiler" and "sfplay".  ".aiff" and ".aifc" files at the above
  850. sampling rates can also be played with playaifc.  (All in /usr/sbin)
  851.  
  852. There is no simple /dev/audio interface on these SGI machines.  (There
  853. was one on 4D/25 machines, reading and writing signed linear 8-bit
  854. samples at rates of 8, 16 and 32 k.)
  855.  
  856. A program "playulaw" was posted as part of the "radio 2.0" release
  857. that I posted to several source groups; it plays raw U-LAW files on
  858. the Indigo, Indigo2, Indy or Personal IRIS audio hardware.
  859.  
  860.         Sony NEWS
  861.         ---------
  862.  
  863. The whole current Sony NEWS line (laptop, desktop, server) have
  864. builtin sound capabilities.  You can buy an external board for the
  865. older NEWS machines.  In the default mode (8k/8-bit mulaw), Sun .au
  866. files are directly supported (you can 'cat' .au files to /dev/sb0 and
  867. have them play.)  The /usr/sony/bin/sbplay command on NEWS-OS 6.0
  868. also supports Sun .au files.
  869.  
  870.         Others
  871.         ------
  872.  
  873. Most other UNIX boxes don't have audio hardware and thus can't play
  874. audio data.  This is actually rapidly changing and most new hardware
  875. that hits the market has some form of audio support.  Unfortunately
  876. there is no single portable interface for audio that comes near the
  877. acceptance and functionality (let alone code size :-) of X11 for
  878. graphics.  There are at least two network-transparent packages, both
  879. in some way based on the X11 architecture, that attempt to fillo the
  880. gap:
  881.  
  882. DEC CRL's AudioFile supports Digital RISC systems running Ultrix,
  883. Digital Alpha AXP systems running OSF/1, Sun Sparcs, and SGI
  884. AL-capable systems (e.g., Indigo, Indy).  The source kit is located at
  885. ftp site crl.dec.com in /pub/DEC/AF.
  886.  
  887. NCD's NetAudio supports NCD's MCX line of X terminals as well as
  888. Sparcs running either SunOS 4.1.3 or Solaris 2.2, using the /dev/audio
  889. interface (they claim it should be easy to port).  The source it
  890. located at ftp.x.org in contrib/netaudio.  It is also ported to SGI
  891. (tested on IRIX 5.x), and there are unconfirmed rumors that it is
  892. being ported to SCI and Linux.
  893.  
  894.  
  895. Playing audio files on the Vaxstation 4000 (VMS)
  896. ------------------------------------------------
  897.  
  898. 1) Without DECsound
  899.  
  900. ".au" files can be played by COPYING them to device "SOA0:".  This
  901. device is set up by enabling the driver SODRIVER.  You can use the
  902. following command file:
  903.  
  904. $!---------------- cut here -------------------------------
  905. $! sound_setup.com    enable SOUND driver
  906. $ run sys$system:sysgen
  907. connect soa0 /adapter=0 /csr=%x0e00 /vector=%o304 /driver=sodriver
  908. exit
  909. $ exit
  910. $!----------------- cut here ------------------------------------
  911.  
  912. 2) With DECsound (bundled with motif)
  913.  
  914. Just start DECsound by selecting it from the session manager in the 
  915. applications menu. (Not there use "@vue$library:sound$vue_startup").
  916. Make sure settings; device type (vaxstation 4000) and play settings
  917. (headphone jack) are selected.  To play files from the DCL prompt 
  918. (handy if you want to play sounds on a remote workstation) set a 
  919. symbol up as follows; 
  920. PLAY == "$DECSOUND -VOLUME 50 -PLAY"
  921. usage;
  922. DCL> play sound.au
  923.  
  924. 3) Audio port
  925.  
  926. The external audio port comes with a telephone-jack-like port.   For
  927. starters, you can plug a telephone RECEIVER right into this port to
  928. hear your first sound files.   After that, you can use the adapter
  929. (that came with the VaxStation), and plug in a small set of stereo
  930. speakers or headphones (the kind you'd plug into a WALKMAN, for 
  931. example), for more volume.  The adapter also has a microphone plug so
  932. that you can record sounds if DECsound is installed.
  933.  
  934.  
  935. Playing audio files on micros
  936. -----------------------------
  937.  
  938. Most micros have at least a speaker built in, so theoretically all you
  939. need is the right software.  Unfortunately most systems don't come
  940. bundled with sound-playing software, so there are many public domain
  941. or shareware software packages, each with their own bugs and features.
  942. Most separate sound recording hardware also comes with playing
  943. software, most of which can play sound (in the file format used by
  944. that hardware) even on machines that don't have that hardware
  945. installed.
  946.  
  947.         PC or compatible
  948.         ----------------
  949.  
  950. Chris S. Craig announces the following software for PCs:
  951.  
  952. ScopeTrax       This is a complete PC sound player/editor package.  Sounds
  953.                 can be played back at ANY rate between 1kHz to 65kHz through
  954.                 the PC speaker or the Sound Blaster.  It supports several
  955.                 file formats including VOC, IFF/8SVX, raw signed and raw
  956.                 unsigned.  A separate executable is provided to convert
  957.                 .au and mu-law to raw format.  ScopeTrax requires EGA/VGA
  958.                 graphics for editing and displaying sounds on a REALTIME
  959.                 oscilloscope.  The package also includes:
  960.                       * An expanded memory player which can play sounds
  961.                         larger than 640K in size.
  962.                       * Basic (rough) sound compression/uncompression
  963.                         utilities.
  964.                       * Complete documentation.
  965.                 The package is FREEWARE!  It is available on SIMTEL in the
  966.                 PD1:[MSDOS.SOUND] directory.
  967.  
  968. One of the appendices below contains a list of more programs to play
  969. sound on the PC.
  970.  
  971.         Atari
  972.         -----
  973.  
  974. For sounds on Atari STs - programs are in the atari/sound/players
  975. directory on atari.archive.umich.edu.
  976.  
  977.         Tandy
  978.         -----
  979.  
  980. On a Tandy 1000, sounds can be played and recorded with DeskMate Sound
  981. (SOUND.PDM), or if they not stored in compressed format, they can also
  982. be played be a program called PLAYSND.  No indication of whether
  983. PLAYSND is PD or not. It hasn't been updated since March of 89.
  984.  
  985.         Amiga
  986.         -----
  987.  
  988. On the Amiga, OmniPlay by David Champion <dgc3@midway.uchicago.edu>
  989. plays and converts IFF-8SVX, AIFF, WAV, VOC, .au, .snd, and 8 bit raw
  990. (signed, unsigned, u-law) samples.  As of version 1.23, OmniPlay will
  991. also convert any playable sample to 8SVX.  Files: wuarchive.wustl.edu
  992. in /systems/amiga/audio/sampleplayers/oplay123.lha (?)
  993. amiga.physik.unizh.ch in mus/play/oplay123.lha
  994.  
  995.         Apple Macintosh
  996.         ---------------
  997.  
  998. Malcolm Slaney from Apple writes:
  999.  
  1000.  "We do have tools to play sound back on most of our Unix hosts.  We wrote
  1001.  a program called TcpPlay that lets us read a sound file on a Unix host,
  1002.  open a TCP/IP connection to the Mac on my desk, and plays the file.  We
  1003.  think of it as X windows for sound (at least a step in that direction.)
  1004.  
  1005.  This software is available for anonymous FTP from ftp.apple.com.
  1006.  Look for  ~ftp/pub/TcpPlay/TcpPlay.sit.hqx.
  1007.  
  1008.  Finally, there are MANY tools for working with sound on the Macintosh. Three
  1009.  applications that come to mind immediately are SoundEdit (formerly by
  1010.  Farralon and now by MacroMind/Paracomp), Alchemy and Eric Keller's Signalyze.
  1011.  There are lots of other tools available for sound editing (including some
  1012.  of the QuickTime Movie tools.)"
  1013.  
  1014. Bill Houle sent the following lists:
  1015.  
  1016. Popular commercial apps are indicated with a [*].  All other programs
  1017. mentioned are shareware/freeware available from SUMEX and the various
  1018. mirror sites, or check archie for the nearest FTP location.
  1019.  
  1020. MAC SOUND EDITORS
  1021.  
  1022. Sample Editor [Garrick McFarlane, McFarlaneGA@Kirk.Vax.Aston.Ac.UK]
  1023.   Plays AIFF and 'snd' sounds.  Can convert between AIFF and 'snd'.
  1024.   Can record from built-in mic.  Can add effects such as fade,
  1025.   normalize, delay, etc.
  1026.  
  1027. Wavicle [Lee Fyock]
  1028.   Plays SoundEdit files.  Can convert to 'snd'.  Can record from built-in mic.
  1029.   Can add effects such as fade, filter, reverb, etc.
  1030.  
  1031. [*]SoundEdit/SoundEdit Pro [Farallon/MacroMind*Paracomp]
  1032.   Plays SoundEdit and 'snd' sounds.  Can read/write SoundEdit files and 'snd' 
  1033.   sounds.  Can record from built-in mic.  Can add effects such as
  1034.   echo, filter, reverb, etc.
  1035.  
  1036.  
  1037. MAC SOUND PLAYERS
  1038.  
  1039. Sound-Tracker  [Frank Seide]
  1040.   Plays Amiga SoundTracker files in foreground or background.
  1041.  
  1042. Macintosh Tracker [Thomas R. Lawrance, tomlaw@world.std.com]
  1043.   Plays Amiga SoundTracker files in foreground or background. A port of Marc
  1044.   Espie's Unix Tracker version with Frank Seide's core player thrown in for
  1045.   good measure.
  1046.  
  1047. The Player [Antoine Rosset & Mike Venturi]
  1048.   Plays AIFF, SoundEdit, MOD, and 'snd' files.
  1049.  
  1050. SoundMaster (aka [*]Kaboom!) [Bruce Tomlin]
  1051.   Associates SoundEdit files to MacOS events.
  1052.  
  1053. SndControl [Riccardo Ettore, 72277.1344@compuserve.com]
  1054.   Associates 'snd' sounds to MacOS events.
  1055.  
  1056. Canon 2 [Glenn Anderson, glenn@otago.ac.nz; Jeff Home, jeff@otago.ac.nz]
  1057.   Plays AIFF or 'snd' files in foreground or background.
  1058.  
  1059. Another Mac play/convert program: "It's called SoundApp. I wrote it,
  1060. (franke1@llnl.gov) and it's FreeWare. It will play: SoundCap,
  1061. SoundEdit, WAVE, VOC, MOD, Amiga IFF (8SVX), Sound Designer, AIFF, AU,
  1062. Mac Resource, and DVI ADPCM. It can convert all the above to System 7
  1063. sound resources (except MOD where just the samples are extracted.) And
  1064. it will double buffer."
  1065.  
  1066.  
  1067. The Sound Site Newsletter
  1068. -------------------------
  1069.  
  1070. An electronic publication with lots of info about digitised sound and
  1071. sound formats, albeit mostly on PCs, is "The Sound Site Newsletter",
  1072. maintained by David Komatsu <davek@uhunix.uhcc.hawaii.edu>.
  1073. Issue 14 appeared in July 1993.  As of that issue, the Sound Site
  1074. Newsletter has expanded its charter to include commercial products and
  1075. will appear monthly.  There is now also a sound site network of ftp
  1076. servers, bulletin boards and authors.  The Sound Site Newsletter (once
  1077. again!) has its own ftp site: sound.usach.cl.
  1078.  
  1079. The Sound Newsletter is posted to: comp.sys.ibm.pc.soundcard
  1080.                                    comp.sys.ibm.pc.misc
  1081.                                    rec.games.misc
  1082. FTP: oak.oakland.edu (misc/sound)
  1083.      garbo.uwasa.fi (pc/sound)
  1084.      sound.usach.cl (pub/Sound/Newsltr) [Home Base]
  1085.  
  1086.  
  1087. Posting sounds
  1088. --------------
  1089.  
  1090. The newsgroup alt.binaries.sounds.misc is dedicated to postings
  1091. containing sound.  (Discussions related to such postings belong in
  1092. alt.binaries.sounds.d.)
  1093.  
  1094. There is no set standard for posting sounds; uuencoded files in most
  1095. popular formats are welcome, if split in parts under 50 kBytes.  To
  1096. accomodate automatic decoding software (such as the ":decode" command
  1097. of the nn newsreader), please place a part indicator of the form
  1098. (mm/nn) at the end of your subject meaning this is number mm of a
  1099. total of nn part.
  1100.  
  1101. It is recommended to post sounds in the format that was used for the
  1102. original recording; conversions to other formats often lose
  1103. information and would do people with identical hardware as the poster
  1104. no favor.  For instance, convering 8-bit linear sound to U-LAW loses
  1105. the lower few bits of the data, and rate changing conversions almost
  1106. always add noise.  Converting from U-LAW to linear requires expansion
  1107. to 16 bit samples if no information loss is allowed!
  1108.  
  1109. U-LAW data is best posted with a NeXT/Sun header.
  1110.  
  1111. If you have to post a file in a headerless format (usually 8-bit
  1112. linear, like ".snd"), please add a description giving at least the
  1113. sampling rate and whether the bytes are signed (zero at 0) or unsigned
  1114. (zero at 0200).  However, it is highly recommended to add a header
  1115. that indicates the sampling rate and encoding scheme; if necessary you
  1116. can use SOX to add a header of your choice to raw data.
  1117.  
  1118. Compression of sound files usually isn't worth it; the standard
  1119. "compress" algorithm doesn't save much when applied to sound data
  1120. (typically at most 10-20 percent), and compression algorithms
  1121. specifically designed for sound (e.g. NeXT's) are usually
  1122. proprietary.  (See also the section "Compression schemes" earlier.)
  1123.  
  1124.